FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5464, 266 aa
1>>>pF1KB5464 266 - 266 aa - 266 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.1683+/-0.000806; mu= 15.6058+/- 0.049
mean_var=61.3476+/-12.420, 0's: 0 Z-trim(106.6): 11 B-trim: 0 in 0/50
Lambda= 0.163748
statistics sampled from 9095 (9102) to 9095 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.66), E-opt: 0.2 (0.28), width: 16
Scan time: 2.210
The best scores are: opt bits E(32554)
CCDS9409.1 ITM2B gene_id:9445|Hs108|chr13 ( 266) 1798 433.0 1e-121
CCDS2479.1 ITM2C gene_id:81618|Hs108|chr2 ( 267) 735 181.9 4e-46
CCDS74665.1 ITM2C gene_id:81618|Hs108|chr2 ( 205) 712 176.4 1.4e-44
CCDS14444.1 ITM2A gene_id:9452|Hs108|chrX ( 263) 683 169.6 2e-42
CCDS33396.1 ITM2C gene_id:81618|Hs108|chr2 ( 220) 661 164.4 6.2e-41
CCDS55455.1 ITM2A gene_id:9452|Hs108|chrX ( 219) 572 143.4 1.3e-34
CCDS33395.1 ITM2C gene_id:81618|Hs108|chr2 ( 230) 323 84.6 7e-17
>>CCDS9409.1 ITM2B gene_id:9445|Hs108|chr13 (266 aa)
initn: 1798 init1: 1798 opt: 1798 Z-score: 2298.7 bits: 433.0 E(32554): 1e-121
Smith-Waterman score: 1798; 100.0% identity (100.0% similar) in 266 aa overlap (1-266:1-266)
10 20 30 40 50 60
pF1KB5 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRAWCWCMCFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRAWCWCMCFG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 LAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 LAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 IFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 IFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 LELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS94 LELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGI
190 200 210 220 230 240
250 260
pF1KB5 QKREASNCFAIRHFENKFAVETLICS
::::::::::::::::::::::::::
CCDS94 QKREASNCFAIRHFENKFAVETLICS
250 260
>>CCDS2479.1 ITM2C gene_id:81618|Hs108|chr2 (267 aa)
initn: 670 init1: 641 opt: 735 Z-score: 941.5 bits: 181.9 E(32554): 4e-46
Smith-Waterman score: 741; 44.2% identity (69.9% similar) in 276 aa overlap (1-265:1-264)
10 20 30 40 50
pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA
:::..:. :.: : : :. : :. : :. : : . . :. : .
CCDS24 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG
10 20 30 40 50
60 70 80 90 100
pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA
. .:.. .: :......:.:.:: : :. . ::. : : : .. .
CCDS24 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV
60 70 80 90 100
110 120 130 140 150 160
pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL
. .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: :
CCDS24 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIEL
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY
::.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.::
CCDS24 NTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY
170 180 190 200 210 220
230 240 250 260
pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS
.:.:: : . :.:: :.:: ::::::: :.::::::
CCDS24 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV
230 240 250 260
>>CCDS74665.1 ITM2C gene_id:81618|Hs108|chr2 (205 aa)
initn: 670 init1: 641 opt: 712 Z-score: 913.9 bits: 176.4 E(32554): 1.4e-44
Smith-Waterman score: 712; 50.2% identity (78.0% similar) in 209 aa overlap (60-265:2-202)
30 40 50 60 70 80
pF1KB5 PPDAVAVDCKDPDDVVPVGQRRAWCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDV
:.. .: :......:.:.:: : :.
CCDS74 MGMVVLLMGLVFASVYIYRYFFLAQLARDNF
10 20 30
90 100 110 120 130 140
pF1KB5 YYCGIKYIKDDVILNEPSADAPAALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIV
. ::. : : : .. . . .::..::. .:. : :.::::.:. .:::.:.
CCDS74 FRCGVLY--------EDSLSSQVRTQMELEEDVKIYLDENYERINVPVPQFGGGDPADII
40 50 60 70 80
150 160 170 180 190 200
pF1KB5 HDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVIT
:::.. :::: :..::::::: :::.::.::::. :::.:.: ::::::.:.:.:.::.:
CCDS74 HDFQRGLTAYHDISLDKCYVIELNTTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVT
90 100 110 120 130 140
210 220 230 240 250 260
pF1KB5 DRIENIDHLGFFIYRLCHDKETYKLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS
... . . :: :::.::. :.::.:.:: : . :.:: :.:: ::::::: :.::::::
CCDS74 EHVSDKEALGSFIYHLCNGKDTYRLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICG
150 160 170 180 190 200
CCDS74 VV
>>CCDS14444.1 ITM2A gene_id:9452|Hs108|chrX (263 aa)
initn: 686 init1: 572 opt: 683 Z-score: 875.3 bits: 169.6 E(32554): 2e-42
Smith-Waterman score: 683; 41.1% identity (72.6% similar) in 270 aa overlap (1-265:1-261)
10 20 30 40 50
pF1KB5 MVKVTFNSALAQKEAKKDEPKSGEEALIIPPDAVAVDCKDPDDVVPVGQRR----AWCWC
:::..::. : ..:.: .. :::. .: .. .. . :.. . :
CCDS14 MVKIAFNTPTA---VQKEEARQDVEALL--SRTVRTQILTGKELRVATQEKEGSSGRCML
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 MCFGLAFMLAGVILGGAYLYKYFALQPDDVYYCG-IKYIKDDVILNEPSADAPAALYQTI
.::.:.:::.:.::: .:::: .: .. : : . .. .. : . : : :
CCDS14 TLLGLSFILAGLIVGGACIYKYF--MPKSTIYRGEMCFFDSEDPANSLRGGEPNFLPVTE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 EENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVM
: .:. :.... .:.:::: :.::::: :.:::.: .:::::: : .::..::::::::
CCDS14 EADIR--EDDNIAIIDVPVPSFSDSDPAAIIHDFEKGMTAYLDLLLGNCYLMPLNTSIVM
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 PPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYKLQRRE
::.::.::. .. .: ::::.:...: .: ...:.....::.:::.::.......:.::.
CCDS14 PPKNLVELFGKLASGRYLPQTYVVREDLVAVEEIRDVSNLGIFIYQLCNNRKSFRLRRRD
180 190 200 210 220 230
240 250 260
pF1KB5 TIKGIQKREASNCFAIRHFENKFAVETLICS
. :..:: ..:. :::: :.: ::: ::
CCDS14 LLLGFNKRAIDKCWKIRHFPNEFIVETKICQE
240 250 260
>>CCDS33396.1 ITM2C gene_id:81618|Hs108|chr2 (220 aa)
initn: 670 init1: 641 opt: 661 Z-score: 848.3 bits: 164.4 E(32554): 6.2e-41
Smith-Waterman score: 661; 53.0% identity (78.4% similar) in 185 aa overlap (81-265:41-217)
60 70 80 90 100 110
pF1KB5 RAWCWCMCFGLAFMLAGVILGGAYLYKYFALQPDDVYYCGIKYIKDDVILNEPSADAPAA
: :. . ::. : : : .. .
CCDS33 AGIKGDKADKASASAPAPASATEILLTPARLARDNFFRCGVLY--------EDSLSSQVR
20 30 40 50 60
120 130 140 150 160 170
pF1KB5 LYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPLN
. .::..::. .:. : :.::::.:. .:::.:.:::.. :::: :..::::::: ::
CCDS33 TQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRGLTAYHDISLDKCYVIELN
70 80 90 100 110 120
180 190 200 210 220 230
pF1KB5 TSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETYK
:.::.::::. :::.:.: ::::::.:.:.:.::.:... . . :: :::.::. :.::.
CCDS33 TTIVLPPRNFWELLMNVKRGTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTYR
130 140 150 160 170 180
240 250 260
pF1KB5 LQRRETIKGIQKREASNCFAIRHFENKFAVETLICS
:.:: : . :.:: :.:: ::::::: :.::::::
CCDS33 LRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV
190 200 210 220
>>CCDS55455.1 ITM2A gene_id:9452|Hs108|chrX (219 aa)
initn: 600 init1: 572 opt: 572 Z-score: 734.7 bits: 143.4 E(32554): 1.3e-34
Smith-Waterman score: 572; 49.4% identity (83.8% similar) in 154 aa overlap (112-265:64-217)
90 100 110 120 130 140
pF1KB5 QPDDVYYCGIKYIKDDVILNEPSADAPAALYQTIEENIKIFEEEEVEFISVPVPEFADSD
. . :. : :.... .:.:::: :.:::
CCDS55 LTGKSTIYRGEMCFFDSEDPANSLRGGEPNFLPVTEEADIREDDNIAIIDVPVPSFSDSD
40 50 60 70 80 90
150 160 170 180 190 200
pF1KB5 PANIVHDFNKKLTAYLDLNLDKCYVIPLNTSIVMPPRNLLELLINIKAGTYLPQSYLIHE
:: :.:::.: .:::::: : .::..::::::::::.::.::. .. .: ::::.:...:
CCDS55 PAAIIHDFEKGMTAYLDLLLGNCYLMPLNTSIVMPPKNLVELFGKLASGRYLPQTYVVRE
100 110 120 130 140 150
210 220 230 240 250 260
pF1KB5 HMVITDRIENIDHLGFFIYRLCHDKETYKLQRRETIKGIQKREASNCFAIRHFENKFAVE
.: ...:.....::.:::.::.......:.::. . :..:: ..:. :::: :.: ::
CCDS55 DLVAVEEIRDVSNLGIFIYQLCNNRKSFRLRRRDLLLGFNKRAIDKCWKIRHFPNEFIVE
160 170 180 190 200 210
pF1KB5 TLICS
: ::
CCDS55 TKICQE
>>CCDS33395.1 ITM2C gene_id:81618|Hs108|chr2 (230 aa)
initn: 334 init1: 316 opt: 323 Z-score: 416.5 bits: 84.6 E(32554): 7e-17
Smith-Waterman score: 484; 34.8% identity (58.3% similar) in 276 aa overlap (1-265:1-227)
10 20 30 40 50
pF1KB5 MVKVTFNSALAQ-KEAKKDE-------PKSGEEALIIPPDAVAVDCKDPDDVVPVGQRRA
:::..:. :.: : : :. : :. : :. : : . . :. : .
CCDS33 MVKISFQPAVAGIKGDKADKASASAPAPASATEILLTP----AREEQPPQHRSKRGGSVG
10 20 30 40 50
60 70 80 90 100
pF1KB5 WCWCMCFGLAFMLAGVILGGAYLYKYFALQP---DDVYYCGIKYIKDDVILNEPSADAPA
. .:.. .: :......:.:.:: : :. . ::. : : : .. .
CCDS33 GVCYLSMGMVVLLMGLVFASVYIYRYFFLAQLARDNFFRCGVLY--------EDSLSSQV
60 70 80 90 100
110 120 130 140 150 160
pF1KB5 ALYQTIEENIKIFEEEEVEFISVPVPEFADSDPANIVHDFNKKLTAYLDLNLDKCYVIPL
. .::..::. .:. : :.::::.:. .:::.:.:::...
CCDS33 RTQMELEEDVKIYLDENYERINVPVPQFGGGDPADIIHDFQRR-----------------
110 120 130 140 150
170 180 190 200 210 220
pF1KB5 NTSIVMPPRNLLELLINIKAGTYLPQSYLIHEHMVITDRIENIDHLGFFIYRLCHDKETY
::::::.:.:.:.::.:... . . :: :::.::. :.::
CCDS33 --------------------GTYLPQTYIIQEEMVVTEHVSDKEALGSFIYHLCNGKDTY
160 170 180 190
230 240 250 260
pF1KB5 KLQRRETIKGIQKREASNCFAIRHFENKFAVETLICS
.:.:: : . :.:: :.:: ::::::: :.::::::
CCDS33 RLRRRATRRRINKRGAKNCNAIRHFENTFVVETLICGVV
200 210 220 230
266 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 12:51:59 2016 done: Sat Nov 5 12:51:59 2016
Total Scan time: 2.210 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]