FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6457, 476 aa
1>>>pF1KE6457 476 - 476 aa - 476 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2708+/-0.000934; mu= 18.7224+/- 0.056
mean_var=85.0850+/-16.304, 0's: 0 Z-trim(107.4): 50 B-trim: 4 in 1/49
Lambda= 0.139043
statistics sampled from 9504 (9548) to 9504 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.659), E-opt: 0.2 (0.293), width: 16
Scan time: 2.220
The best scores are: opt bits E(32554)
CCDS4955.1 TINAG gene_id:27283|Hs108|chr6 ( 476) 3395 691.1 6.5e-199
CCDS343.1 TINAGL1 gene_id:64129|Hs108|chr1 ( 467) 1533 317.6 1.8e-86
CCDS72745.1 TINAGL1 gene_id:64129|Hs108|chr1 ( 362) 1324 275.6 6.1e-74
CCDS55586.1 TINAGL1 gene_id:64129|Hs108|chr1 ( 436) 1165 243.8 2.8e-64
CCDS8282.1 CTSC gene_id:1075|Hs108|chr11 ( 463) 300 70.3 5e-12
>>CCDS4955.1 TINAG gene_id:27283|Hs108|chr6 (476 aa)
initn: 3395 init1: 3395 opt: 3395 Z-score: 3684.6 bits: 691.1 E(32554): 6.5e-199
Smith-Waterman score: 3395; 99.4% identity (99.8% similar) in 476 aa overlap (1-476:1-476)
10 20 30 40 50 60
pF1KE6 MWTGYKILIFSYLTTEIWMEKRYLSQREVDLEAYFTRNHTVLQGTRFKRAIFQGQYCRNF
:::::::::::::::::::::.::::::::::::::::::::::::::::::::::::::
CCDS49 MWTGYKILIFSYLTTEIWMEKQYLSQREVDLEAYFTRNHTVLQGTRFKRAIFQGQYCRNF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 GCCEDRDDGCVTEFYAANALCYCDKFCDRENSDCCPDYKSFCREEKEWPPHTQPWYPEGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS49 GCCEDRDDGCVTEFYAANALCYCDKFCDRENSDCCPDYKSFCREEKEWPPHTQPWYPEGC
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 FKDGQHYEEGSVIKENCNSCTCSGQQWKCSQHVCLVRSELIEQVNKGDYGWTAQNYSQFW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS49 FKDGQHYEEGSVIKENCNSCTCSGQQWKCSQHVCLVRSELIEQVNKGDYGWTAQNYSQFW
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 GMTLEDGFKFRLGTLPPSLMLLSMNEMTASLPATTDLPEFFVASYKWPGWTHGPLDQKNC
:::::::::::::::::: :::::::::::::::::::::::::::::::::::::::::
CCDS49 GMTLEDGFKFRLGTLPPSPMLLSMNEMTASLPATTDLPEFFVASYKWPGWTHGPLDQKNC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 AASWAFSTASVAADRIAIQSKGRYTANLSPQNLISCCAKNRHGCNSGSIDRAWWYLRKRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS49 AASWAFSTASVAADRIAIQSKGRYTANLSPQNLISCCAKNRHGCNSGSIDRAWWYLRKRG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 LVSHACYPLFKDQNATNNGCAMASRSDGRGKRHATKPCPNNVEKSNRIYQCSPPYRVSSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS49 LVSHACYPLFKDQNATNNGCAMASRSDGRGKRHATKPCPNNVEKSNRIYQCSPPYRVSSN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 ETEIMKEIMQNGPVQAIMQVHEDFFHYKTGIYRHVTSTNKESEKYRKLQTHAVKLTGWGT
::::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::
CCDS49 ETEIMKEIMQNGPVQAIMQVREDFFHYKTGIYRHVTSTNKESEKYRKLQTHAVKLTGWGT
370 380 390 400 410 420
430 440 450 460 470
pF1KE6 LRGAQGQKEKFWIAANSWGKSWGENGYFRILRGVNESDIEKLIIAAWGQLTSSDEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS49 LRGAQGQKEKFWIAANSWGKSWGENGYFRILRGVNESDIEKLIIAAWGQLTSSDEP
430 440 450 460 470
>>CCDS343.1 TINAGL1 gene_id:64129|Hs108|chr1 (467 aa)
initn: 1459 init1: 662 opt: 1533 Z-score: 1666.1 bits: 317.6 E(32554): 1.8e-86
Smith-Waterman score: 1533; 49.6% identity (73.5% similar) in 427 aa overlap (54-474:45-463)
30 40 50 60 70 80
pF1KE6 LSQREVDLEAYFTRNHTVLQGTRFKRAIFQGQYCRNFG-CCEDRDDGCVTEFYAANALCY
:.::.. ::. : : :. . .: .::
CCDS34 AGHLALGAQQGRGRRELAPGLHLRGIRDAGGRYCQEQDLCCRGRADDCALPYLGA--ICY
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE6 CDKFCDRENSDCCPDYKSFCREEKEWPPHTQPWYP-EGCFKDGQHYEEGSVIKENCNSCT
:: ::.: ::::::. .:: :: :. : .::.. :. : .. .::: ::
CCDS34 CDLFCNRTVSDCCPDFWDFCLGV---PP---PFPPIQGCMHGGRIYPVLGTYWDNCNRCT
80 90 100 110 120
150 160 170 180 190 200
pF1KE6 CS-GQQWKCSQHVCLVRSELIEQVNKGDYGWTAQNYSQFWGMTLEDGFKFRLGTLPPSLM
:. ..::.:.:. ::: ..:. .:.:.::: : :.: ::::::..:...::::. ::
CCDS34 CQENRQWQCDQEPCLVDPDMIKAINQGNYGWQAGNHSAFWGMTLDEGIRYRLGTIRPSSS
130 140 150 160 170 180
210 220 230 240 250 260
pF1KE6 LLSMNEMTASLPATTDLPEFFVASYKWPGWTHGPLDQKNCAASWAFSTASVAADRIAIQS
...:.:. . : :: : :: :::. : :::: :::.:::::::.::.::..:.:
CCDS34 VMNMHEIYTVLNPGEVLPTAFEASEKWPNLIHEPLDQGNCAGSWAFSTAAVASDRVSIHS
190 200 210 220 230 240
270 280 290 300 310
pF1KE6 KGRYTANLSPQNLISCCAKNRHGCNSGSIDRAWWYLRKRGLVSHACYPLF---KDQNATN
:..: ::::::.:: .....:: .: .: :::.::.::.:: :::. .:. .
CCDS34 LGHMTPVLSPQNLLSCDTHQQQGCRGGRLDGAWWFLRRRGVVSDHCYPFSGRERDEAGPA
250 260 270 280 290 300
320 330 340 350 360 370
pF1KE6 NGCAMASRSDGRGKRHATKPCPNNVEKSNRIYQCSPPYRVSSNETEIMKEIMQNGPVQAI
: : ::. :::::.:: :::. ..: ::: .: ::..::. :::::.:.::::::.
CCDS34 PPCMMHSRAMGRGKRQATAHCPNSYVNNNDIYQVTPVYRLGSNDKEIMKELMENGPVQAL
310 320 330 340 350 360
380 390 400 410 420 430
pF1KE6 MQVHEDFFHYKTGIYRHVTSTNKESEKYRKLQTHAVKLTGWGTLRGAQGQKEKFWIAANS
:.:::::: :: ::: :. . . :.::. ::.::.:::: .:. :.: ::::
CCDS34 MEVHEDFFLYKGGIYSHTPVSLGRPERYRRHGTHSVKITGWGEETLPDGRTLKYWTAANS
370 380 390 400 410 420
440 450 460 470
pF1KE6 WGKSWGENGYFRILRGVNESDIEKLIIAAWGQLTSSDEP
:: .::: :.:::.::::: :::......::.. :
CCDS34 WGPAWGERGHFRIVRGVNECDIESFVLGVWGRVGMEDMGHH
430 440 450 460
>>CCDS72745.1 TINAGL1 gene_id:64129|Hs108|chr1 (362 aa)
initn: 1299 init1: 662 opt: 1324 Z-score: 1441.0 bits: 275.6 E(32554): 6.1e-74
Smith-Waterman score: 1324; 51.3% identity (75.8% similar) in 355 aa overlap (124-474:4-358)
100 110 120 130 140 150
pF1KE6 CCPDYKSFCREEKEWPPHTQPWYPEGCFKDGQHYEEGSVIKENCNSCTCS-GQQWKCSQH
:. : .. .::: :::. ..::.:.:.
CCDS72 MHGGRIYPVLGTYWDNCNRCTCQENRQWQCDQE
10 20 30
160 170 180 190 200 210
pF1KE6 VCLVRSELIEQVNKGDYGWTAQNYSQFWGMTLEDGFKFRLGTLPPSLMLLSMNEMTASLP
::: ..:. .:.:.::: : :.: ::::::..:...::::. :: ...:.:. . :
CCDS72 PCLVDPDMIKAINQGNYGWQAGNHSAFWGMTLDEGIRYRLGTIRPSSSVMNMHEIYTVLN
40 50 60 70 80 90
220 230 240 250 260 270
pF1KE6 ATTDLPEFFVASYKWPGWTHGPLDQKNCAASWAFSTASVAADRIAIQSKGRYTANLSPQN
:: : :: :::. : :::: :::.:::::::.::.::..:.: :..: :::::
CCDS72 PGEVLPTAFEASEKWPNLIHEPLDQGNCAGSWAFSTAAVASDRVSIHSLGHMTPVLSPQN
100 110 120 130 140 150
280 290 300 310 320
pF1KE6 LISCCAKNRHGCNSGSIDRAWWYLRKRGLVSHACYPLF---KDQNATNNGCAMASRSDGR
:.:: .....:: .: .: :::.::.::.:: :::. .:. . : : ::. ::
CCDS72 LLSCDTHQQQGCRGGRLDGAWWFLRRRGVVSDHCYPFSGRERDEAGPAPPCMMHSRAMGR
160 170 180 190 200 210
330 340 350 360 370 380
pF1KE6 GKRHATKPCPNNVEKSNRIYQCSPPYRVSSNETEIMKEIMQNGPVQAIMQVHEDFFHYKT
:::.:: :::. ..: ::: .: ::..::. :::::.:.::::::.:.:::::: ::
CCDS72 GKRQATAHCPNSYVNNNDIYQVTPVYRLGSNDKEIMKELMENGPVQALMEVHEDFFLYKG
220 230 240 250 260 270
390 400 410 420 430 440
pF1KE6 GIYRHVTSTNKESEKYRKLQTHAVKLTGWGTLRGAQGQKEKFWIAANSWGKSWGENGYFR
::: :. . . :.::. ::.::.:::: .:. :.: :::::: .::: :.::
CCDS72 GIYSHTPVSLGRPERYRRHGTHSVKITGWGEETLPDGRTLKYWTAANSWGPAWGERGHFR
280 290 300 310 320 330
450 460 470
pF1KE6 ILRGVNESDIEKLIIAAWGQLTSSDEP
:.::::: :::......::.. :
CCDS72 IVRGVNECDIESFVLGVWGRVGMEDMGHH
340 350 360
>>CCDS55586.1 TINAGL1 gene_id:64129|Hs108|chr1 (436 aa)
initn: 1299 init1: 606 opt: 1165 Z-score: 1267.5 bits: 243.8 E(32554): 2.8e-64
Smith-Waterman score: 1346; 46.5% identity (67.6% similar) in 426 aa overlap (54-474:45-432)
30 40 50 60 70 80
pF1KE6 LSQREVDLEAYFTRNHTVLQGTRFKRAIFQGQYCRNFG-CCEDRDDGCVTEFYAANALCY
:.::.. ::. : : :. . .: .::
CCDS55 AGHLALGAQQGRGRRELAPGLHLRGIRDAGGRYCQEQDLCCRGRADDCALPYLGA--ICY
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE6 CDKFCDRENSDCCPDYKSFCREEKEWPPHTQPWYP-EGCFKDGQHYEEGSVIKENCNSCT
:: ::.: ::::::. .:: :: :. : .::.. :. : .. .::: :
CCDS55 CDLFCNRTVSDCCPDFWDFCLGV---PP---PFPPIQGCMHGGRIYPVLGTYWDNCNRC-
80 90 100 110 120
150 160 170 180 190 200
pF1KE6 CSGQQWKCSQHVCLVRSELIEQVNKGDYGWTAQNYSQFWGMTLEDGFKFRLGTLPPSLML
: : :.: ::::::..:...::::. :: .
CCDS55 -----------------------------WQAGNHSAFWGMTLDEGIRYRLGTIRPSSSV
130 140 150
210 220 230 240 250 260
pF1KE6 LSMNEMTASLPATTDLPEFFVASYKWPGWTHGPLDQKNCAASWAFSTASVAADRIAIQSK
..:.:. . : :: : :: :::. : :::: :::.:::::::.::.::..:.:
CCDS55 MNMHEIYTVLNPGEVLPTAFEASEKWPNLIHEPLDQGNCAGSWAFSTAAVASDRVSIHSL
160 170 180 190 200 210
270 280 290 300 310
pF1KE6 GRYTANLSPQNLISCCAKNRHGCNSGSIDRAWWYLRKRGLVSHACYPLF---KDQNATNN
:..: ::::::.:: .....:: .: .: :::.::.::.:: :::. .:. .
CCDS55 GHMTPVLSPQNLLSCDTHQQQGCRGGRLDGAWWFLRRRGVVSDHCYPFSGRERDEAGPAP
220 230 240 250 260 270
320 330 340 350 360 370
pF1KE6 GCAMASRSDGRGKRHATKPCPNNVEKSNRIYQCSPPYRVSSNETEIMKEIMQNGPVQAIM
: : ::. :::::.:: :::. ..: ::: .: ::..::. :::::.:.::::::.:
CCDS55 PCMMHSRAMGRGKRQATAHCPNSYVNNNDIYQVTPVYRLGSNDKEIMKELMENGPVQALM
280 290 300 310 320 330
380 390 400 410 420 430
pF1KE6 QVHEDFFHYKTGIYRHVTSTNKESEKYRKLQTHAVKLTGWGTLRGAQGQKEKFWIAANSW
.:::::: :: ::: :. . . :.::. ::.::.:::: .:. :.: :::::
CCDS55 EVHEDFFLYKGGIYSHTPVSLGRPERYRRHGTHSVKITGWGEETLPDGRTLKYWTAANSW
340 350 360 370 380 390
440 450 460 470
pF1KE6 GKSWGENGYFRILRGVNESDIEKLIIAAWGQLTSSDEP
: .::: :.:::.::::: :::......::.. :
CCDS55 GPAWGERGHFRIVRGVNECDIESFVLGVWGRVGMEDMGHH
400 410 420 430
>>CCDS8282.1 CTSC gene_id:1075|Hs108|chr11 (463 aa)
initn: 451 init1: 172 opt: 300 Z-score: 329.4 bits: 70.3 E(32554): 5e-12
Smith-Waterman score: 437; 28.9% identity (56.0% similar) in 377 aa overlap (100-466:116-457)
70 80 90 100 110 120
pF1KE6 CVTEFYAANALCYCDKFCDRENSDCCPDYKSFCREEKEWPPHTQPWYPEGCFKDGQHYEE
..: : : .:: :..
CCDS82 IIYNQGFEIVLNDYKWFAFFKYKEEGSKVTTYCNETMTGWVHDVLGRNWACFT-GKKVGT
90 100 110 120 130 140
130 140 150 160 170 180
pF1KE6 GSVIKENC--NSCTCSGQQWKCSQHVCLVRSELIEQVNKGDYGWTAQNYSQFWGMTLEDG
.: :: : ...: : :... .... .: . .::: .: .. .:: :
CCDS82 AS---ENVYVNIAHLKNSQEKYSNRLYKYDHNFVKAINAIQKSWTATTYMEYETLTLGDM
150 160 170 180 190 200
190 200 210 220 230 240
pF1KE6 FKFRLGTLPPSLMLLSMNEMTASLPATT-DLPEFFVASYKWPGWTHG-----PL-DQKNC
.. : : .. . .:: . :: .:. : . .:: :. .: .:
CCDS82 IR-RSGGHSRKIPRPKPAPLTAEIQQKILHLP----TSWDWRN-VHGINFVSPVRNQASC
210 220 230 240 250
250 260 270 280 290
pF1KE6 AASWAFSTASVAADRIAIQSKGRYTANLSPQNLISCCAKNRHGCNSG-SIDRAWWYLRKR
.. ..:.. .. :: : ... : ::::...:: .. .::..: : : .
CCDS82 GSCYSFASMGMLEARIRILTNNSQTPILSPQEVVSC-SQYAQGCEGGFPYLIAGKYAQDF
260 270 280 290 300 310
300 310 320 330 340 350
pF1KE6 GLVSHACYPLFKDQNATNNGCAMASRSDGRGKRHATKPCPNNVEKSNRIYQCSPPYRVSS
::: .::.: ..:.. : : . : : . . :. . .
CCDS82 GLVEEACFPY----TGTDSPCKM--KED----------C---FRYYSSEYHYVGGFYGGC
320 330 340 350
360 370 380 390 400 410
pF1KE6 NETEIMKEIMQNGPVQAIMQVHEDFFHYKTGIYRHVTSTNKESEKYRKLQTHAVKLTGWG
::. . :....::. . ..:..::.::: :::.: . .. . .: .::: :.:.:
CCDS82 NEALMKLELVHHGPMAVAFEVYDDFLHYKKGIYHH--TGLRDPFNPFELTNHAVLLVGYG
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE6 TLRGAQGQKEKFWIAANSWGKSWGENGYFRILRGVNESDIEKLIIAAWGQLTSSDEP
: .:.:. .::. :::: .::::::::: ::..: ::.. .::
CCDS82 T-DSASGMD--YWIVKNSWGTGWGENGYFRIRRGTDECAIESIAVAATPIPKL
420 430 440 450 460
476 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 13:28:51 2016 done: Tue Nov 8 13:28:51 2016
Total Scan time: 2.220 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]